为所有的小区建立模型,输出其是否为异常值,使用的数据类似usenumdf.head()

利用modeldf的预测结果,建立一个预测未来是否为异常值的模型,二分类模型,由于小区之间的差异性较大,感觉单独为每个小区建立一个模型会更好一些。

XGBOD 效果较好,因为它使用了类别标签

二分类算法的效果会更好(针对类别不平衡的数据,还可以考虑使用一些数据平衡的方法)

针对某小区使用更多的特征

新的数据准备好后,可以采用与上面相同的方式,建立分类模型

注意:因为我们的小区较多,所以不可能手动的进行对每个小区,调出一组合适的建模参数,因此可以采用参数搜索的方式,自动的为每个小区建模获得较优的一组参数和模型